iT邦幫忙

2025 iThome 鐵人賽

DAY 1
0
AI & Data

資料科學中的線性代數系列 第 1

資料科學中的線性代數 Day 1 - 未來的章節規劃與向量空間與子空間介紹

  • 分享至 

  • xImage
  •  

歡迎來到資料科學中的線性代數第一天~

前言與背景介紹

本人先來做個背景介紹,相信如果我這個學渣能夠學會接下來的內容,你也一定可以做到!!我呢高中讀的是私立的高職,接著大學是國立科大管理學院中跟資管蠻像的科系。目前剛從大學畢業準備進入資管系的碩士生涯!

會想要發起這個主題的原因是近期開始參與了實驗室的 meeting 發現自己雖然對於資料科學的理論有一定程度的理解,但當學長姐報論文報到論文內的公式時,我的大腦會直接進入放空狀態😂 然後就開始看不懂了哈哈哈

所以呢 希望趁開學前這段時間提高自己對數學的敏感度,故選了線性代數這門在資料科學中十分常見也必學的數學理論。希望未來 30 天我能夠不要偷懶持續學習~

30天規劃介紹(表格為 ai 生成)

與我的助理(gpt5)徹夜未眠的討論過後呢,未來 30 天預計會有下列的主題:

Day 標題 目標
1 向量空間與子空間 明確向量空間公理與子空間三條件,能檢驗集合是否為子空間。
2 線性組合與 Span 定義 span(S) 與其最小性,能求生成集與維度。
3 線性獨立、基、維度 掌握「獨立 ⇔ 唯一表示」、基底存在與維度唯一性。
4 線性映射、核與像 建立線性映射與矩陣對應;定義 ker(T) 與 im(T)。
5 Rank–Nullity 理解 dim(ker A) + rank(A) = n,並能估解空間維度。
6 變基與相似 認識相似變換保持秩與特徵值;能寫座標變換矩陣。
7 行列式與可逆 連結 det(A) != 0 與可逆性;幾何體積伸縮詮釋。
8 內積與不等式 建立內積空間;掌握 Cauchy–Schwarz 與三角不等式。
9 正交投影 投影矩陣性質 P^2 = P、P^T = P;最小距離特性。
10 Gram–Schmidt / QR 用 GS 構造正交基並得到 A = Q R。
11 最小平方與正規方程 從優化導出 A^T A x = A^T b;滿秩時給閉式解。
12 Moore–Penrose 逆 理解 A^+ 四條件與唯一性;連結最小範數最小平方解。
13 SPD 與二次型;Cholesky 判定 SPD:x^T A x > 0;理解 A = L L^T 的條件。
14 週回顧+小測 證 G = X^T X 為 PSD 等;整理本週重點與盲點。
15 譜與最小多項式 定義特徵值/向量、譜半徑與最小多項式的基本性質。
16 光譜定理(對稱) 對稱矩陣可正交對角化:A = Q Lambda Q^T;特徵向量正交。
17 Rayleigh quotient 以「max over unit-norm x of (x^T A x)」刻畫最大特徵值。
18 冪法 掌握冪法收斂條件與速度(譜間隙);能估方向誤差。
19 SVD 存在與結構 由 A^T A 的譜推導 A = U Sigma V^T;理解奇異值含義。
20 Eckart–Young–Mirsky 截斷 SVD 給出最佳低秩逼近;理解 Frobenius 誤差。
21 PCA:兩種推導 以最大方差與最小重建誤差推導 PCA;與 SVD 等價。
22 條件數與靈敏度 定義 kappa(A) = norm2(A) * norm2(inv(A));估誤差放大。
23 正規方程 vs QR/SVD 說明 kappa(X^T X) = kappa(X)^2;比較數值穩定性。
24 矩陣範數與不等式 熟悉 2-範數與 Frobenius;掌握次乘法性與常見不等式。
25 Gram 矩陣與核 PSD 條件:對任意 c,c^T K c >= 0;內積嵌入觀點。
26 線性分類器與 KKT 硬間隔最大化的一階必要條件;拉格朗日與 KKT 直觀。
27 矩陣分解即最佳化 目標函數:normF(R − U V^T)^2;固定一方即為最小平方。
28 Perron–Frobenius/PageRank 非負不可約矩陣的主特徵值/向量與穩態分佈。
29 綜合證明日(擇二) 證明:PSD <=> 存在 B 使 A = B^T B;PCA <=> SVD;投影唯一性。
30 總結:定理→應用地圖 產出一張 Cheat Sheet,將核心定理對應到資料科學場景。

向量空間與子空間

確定了上述的規劃後,我們立刻開始第一天的學習吧~
在學習前需要幫大家複習一些概念“零向量”與“純量乘法”

零向量

零向量 = (0,0,…,0)

也就是說呢 v+0=v 指的就是一個向量空間裡,所有分量都為 0 的特殊向量。

純量乘法(scalar multiplication)

也就是說呢,把一個常數乘到一個向量上,結果還是向量。

3⋅(1,2)=(3,6)
0⋅(1,2,3)=(0,0,0)#也就是零向量

向量空間介紹

向量空間是一個「向量的集合」,配上加法和純量乘法這兩種運算,而且這兩種運算需要滿足一系列的規則。(5 條加法 + 5 條乘法 = 10 條)

1.加法封閉性 [加法]
也就是說向量空間進行加法後不會跳出集合。

(1,2)+(3,4)=(4,6) 

2.加法交換律 [加法]
看名稱好像很複雜,但其實就是相加次序不影響結果。

(1,2)+(3,4)=(4,6)
(3,4)+(1,2)=(4,6)

3.加法結合律 [加法]
也就是說配對不會影響總和

((1,0)+(2,1))+(3,2)=(6,3)=(1,0)+((2,1)+(3,2))

4.零向量存在 [加法]
向量裡頭存在 0 向量,使得 x + 0 = x

5.加法反元素存在 [加法]
對於每個向量,存在 -v 使得 v+(-v)=0 。也就是說每個元素都能被「抵銷」。

6.向量乘法封閉 [乘法]
也就是說放大/縮小仍留在集合內。

2⋅(1,3)=(2,6) ∈ R^2

7.8. 分配律 [乘法]
在向量空間中先加後乘 = 逐一相乘再加。

c(u+v)=cu+cv #一個純量分配給兩個向量(純量固定,向量變)。 #7
(c+d)v=cv+dv #一個向量分配給兩個純量(向量固定,純量變)。 #8

9.向量乘法結合律 [乘法]
連續縮放的效果等同於把倍率相乘。

c(dv)=(cd)v。

10.乘法的單位元 [乘法]
不改變大小的倍率是 1

1v=v
1⋅(7,−2)=(7,−2)

子空間的三個檢驗條件

大家或許會很好奇到底為什麼樣做這些檢查?我也是。
我們可以想像向量空間是一個大國家,而子空間會是個特區的感覺。
我們必須先確保這個特區裡有大家都能用的 0 號人物(零向量)
接著必須確保特區保證不會把人(向量)送出特區(加法、數乘後仍在內)
檢查三條就是要確認「這個特區沒有漏水」—做運算不會跑出來,而且生活條件完整。

例:

W={(x,y)∈R2∣x+y=0}

子空間檢驗條件 1:起點有嗎(零向量在不在)
大家覺得零向量 (0,0) 在不在 𝑊?
檢查發現 0+0 = 0 向量在集合裡,所以條件 1 OK~

子空間檢驗條件 2:加法不會跑出去嗎(加法封閉)
隨便取兩個在 𝑊 裡的向量,例如 (1,−1) 和 (2,−2),相加得到多少?
我們可以看到 x+y=0

子空間檢驗條件 3:縮放不會跑出去嗎(數乘封閉)
取任意 (a,−a)∈W 與純量 𝑐 檢查看看~
c(a,−a)=(ca,−ca)-> 4(1, -1) = (4, -4)仍滿足 x+y=0 故通過!

結語

今天我們學會了兩件關鍵事:向量空間的 10 條公理,以及判斷「某集合是不是子空間」的三條件。接下來要學會的是讓子空間長出來——方法就是「線性組合」。這部分我們明天繼續學習!


下一篇
資料科學中的線性代數 Day 2 - 線性組合與 Span
系列文
資料科學中的線性代數3
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言